#include<iostream>
#include <cuda_runtime.h>
using namespace std;

__global__ void hello(){
    printf("hello world from thread %d\n", threadIdx.x);
}

int main(){
    hello<<<1, 10>>>();
    cudaDeviceSynchronize();
}


/*
这里的<<<1, 10>>>中，1是线程块，10是每块里面的线程数量。所以8，100的话会输出8租1~99的

__global__	表示 GPU 上运行、CPU 调用的函数（kernel）	GPU 上运行
__device__	只能从 GPU 上调用的函数	GPU 上运行
__host__	明确声明为 CPU 上运行（可省略）	CPU 上运行


*/